С батла «Ящик Пандоры, или Путь в светлое будущее» в рамках «КорФор-2023» стартовала активная дискуссия по искусственному теллекту (ИИ), что стало мейнстримом всех книжных, научных и образовательных конференций следующего года. Сейчас коллеги стали глубже погружаться в процессы, многие вендоры начали разрабатывать пакетные решения и инструменты, на книжный рынок пришли крупные экосистемы: «Яндекс», VK, «Сбер», которые активно внедряют ИИ-сервисы в нашу повседневную жизнь. В прошлом году эксперты сделали вывод о том, что ИИ — это возможности, которыми управляет человек, и ими надо учиться пользоваться.
Как складывается ситуация с практическим применением нейросетевых инструментов в отрасли сегодня? Какие проекты оказались успешными, а какие требуют доработки? На какие задачи ориентируют ИИ-разработки агрегаторы контента, библиотеки и издатели?
В рамках конференции «КорФор-2024» состоялся круглый стол на тему «ИИ в науке, образовании и работе с информацией: от ожиданий к реальности».
Исполнительный директор компании Антиплагиат Юрий ЧЕХОВИЧ выступил с докладом «Модели генеративного искусственного интеллекта с полным их разоблачением» (подробнее см. в июньском номере «УК»), а также перечислил основные признаки искусственно созданного текста:
— Не существует объективных доказательств использования ИИ в тексте, нет никакой базы данных, с которой можно свериться, поэтому приходится анализировать экспертным способом. Практика позволила накопить набор признаков, подтверждающих искусственность учебных и научных работ. Во-первых, это несогласованность и нарушение связности. Моделям пока трудно работать на больших текстах, так что часто это первый важный признак. Второй детектор — наличие банальностей, трюизмов, «эффект жвачки»: много текста, а пользы нет. Кроме того, в таких текстах встречаются фразы, не несущие смысловой нагрузки. Эти предложения формально корректны, но, если их убрать, текст не потеряет ничего, кроме объёма. Часто последовательность мыслей повторяется в разных словах. Ещё один признак — нарушение логики построения текста. И два момента, связанных со ссылками: отсутствие ссылок там, где они необходимы, и наличие там, где их не должно быть. Это признак того, что генеративная модель использовалась для парафраза. И последний критерий — стилистическая неоднородность. Так как очень часто сгенерированный текст используется для того, чтобы нарастить объём оригинальной рукописи, границы перехода видны невооружённым глазом.
Как отметил эксперт, каждый из этих признаков по отдельности не говорит о том, что текст искусственный: и человек может совершать такие ошибки. Но когда они встречаются в большом количестве и вместе, это почти неизбежно сгенерированный материал. Если такие ошибки допустит исследователь без помощи генеративных сервисов, это тоже будет основанием не принять работу: как правило, такой текст не соответствует требованиям, предъявляемым к статьям или дипломам. Именно поэтому Антиплагиат рекомендует не отклонять работы просто на основании пометки о подозрительности. Необходимо запрашивать дополнительные сведения. Если искусственный текст обнаруживается, следует обсуждать работу с её автором, совершенствовать нормативную базу организации и стимулировать открытость промежуточных и финальных результатов.
Потенциальные сферы использования ИИ в крупной издательской корпорации обозначил менеджер по тренингу клиентов компании Wiley (Рим) Фабио ДИ БЕЛЛО. Как отметил эксперт, на платформе Wiley содержится в общей сложности около 600 тыс. публикаций по теме ИИ, причём за последние пять лет появилось 165 тыс. материалов. Российские учёные за это время сделали вклад в размере 900 публикаций. Бóльшая часть исследований относится к медицине, за ними следуют инженерное дело и машинное обучение.
По словам выступающего, основы цифровой трансформации составляют три важные технологии: ИИ, большие данные и облачные вычисления. Преимущества заключаются в снижении затрат и повышении эффективности за счёт автоматизации процессов. Но аналитика важна, и именно критические суждения приводят к оптимизации. Использование ИИ делает контент более доступным — к этому выводу пришли в издательстве.
— Мы переходим от разрозненной информации к миру знаний, в котором ИИ объединяет различные формы контента, глубоко раскрывая их сущность и значимость. Таким образом формируются контекстуальные знания, обеспечивающие развёрнутую перспективу исследований, — подчеркнул Фабио ди Белло.
Эксперт подробно остановился на экспериментах, проведённых Wiley с помощью ИИ.
Проверка качества письма и его улучшение, пожалуй, самая распространённая область применения ИИ в науке. В Wiley пришли к выводу о том, что ChatGPT может изменить качество написанной работы и даже дать рациональную обратную связь. Он понимает специфические термины и способен исправлять ошибки, может представить текст таким образом, чтобы тот стал более логичным, а используемая лексика — более разнообразной. В частности, ChatGPT смог написать аннотацию к тексту на основе полной версии и дал разумное объяснение, почему выбрал именно такое название. На платформе доступна специализированная программа для публикующихся учёных Journal Finder. В издательстве провели опыт: сравнили результаты поиска этого сервиса и ChatGPT. Оказалось, что программа выдала более чёткие результаты. Wiley также использует ChatGPT для написания саммари, причём риск получения недостоверной информации минимальный.
Как отметил спикер, в мире, где исследователи сталкиваются с переизбытком информации, а издатели — со сложностью её распространения, ИИ можно применять для извлечения ключевых слов, концепций и понятий. Выделение ключевых слов — опция, важная для тех сфер, где информацию трудно извлечь из неструктурированного текста. Ещё один пример использования ИИ — преобразование научной статьи в карту знаний. Кроме того, были кейсы по трансформации видеоконтента в другие форматы, чтобы информация воспринималась зрительно, на слух и в текстовом виде. Также возможно применять ИИ для поиска видео по изображениям и тексту. Следующий эксперимент — поиск рецензентов. В Wiley сравнили результаты поиска ChatGPT и специальной программы издательства. ChatGPT пока уступает сервису: он выдаёт несуществующих экспертов, поэтому специальная программа более надёжна и релевантна.
Насколько мы можем доверять ИИ при написании статей? Должны ли мы признавать его автором и пересмотреть законы об авторском праве и интеллектуальной собственности? Эксперт считает, что в будущем соперничать будут не машины с машинами, а люди, которые смогут применять ИИ, и те, кто этого не сумеет. ChatGPT для эффективного использования требует умения формулировать запросы, вводить нужные данные. Если вы не умеете формулировать запросы, то на выходе получите нерелевантные результаты, что потребует переработки. Генеративный ИИ способен повысить качество исследований, но может повлечь ряд проблем, в частности существует риск манипулирования с помощью нейросетей. Очевидно, что стратегии борьбы с этими вызовами будут совершенствоваться.
— Мы не хотим, чтобы человек превратился в машину, а ИИ обрёл свойства эмпатии и эмоциональный интеллект, поэтому издатели, учёные, исследователи должны вместе работать над тем, чтобы решать проблемы в области ИИ, — отметил в завершение спикер.
В ходе последовавшей за выступлениями дискуссии участники круглого стола поделились историями успеха и не вполне удачными кейсами, а также рассказали от том, чего не хватает для более эффективного и активного применения ИИ на практике.
Дарья НУЖДОВА, специалист Библиотеки имени Д.С. Лихачёва Централизованной библиотечной системы (ЦБС) Выборгского района (Санкт-Петербург):
— Мы стали активно использовать ИИ ещё в 2022 г., когда это движение только начинало зарождаться. Для всероссийского форума сделали символ проекта, сгенерировав его в сети Midjourney. Погрузившись в тему, используем разные общедоступные нейросети для генерации текстов, изображений с целью наполнения контентом соцсетей и для рутинной библиотечной работы: создания афиш, подготовки сценариев мероприятий, их наименований, написания статей, выделения ключевых слов и подготовки аннотаций. Обучаем коллег из других ЦБС. Продолжаем использовать нейросети, теперь и для создания видеоконтента, логотипов проектов, музыки, которую можно использовать в соцсетях. У меня в основном положительные впечатления от использования нейросетей, я технооптимист, амбассадор ИИ.
Павел ЛУШНИКОВ, заместитель директора по цифровизации Российской государственной библиотеки (РГБ):
— У нас достаточно богатый опыт применения ИИ, и здесь работает принцип Парето: 20% усилий приводят к 80% результатов, и наоборот. В основном область применения — это повышение эффективности внутренних процессов, роботизация, снабжённая когнитивными функциями. За прошлый год мы втрое повысили эффективность каталогизации: 300 тыс. записей в 2022 г. и 933 тыс. — в 2023-м. Наши технологические цепочки предполагают, что любая книга, которая выдаётся читателю, должна быть хотя бы кратко описана. Теперь с помощью автоматизированных сервисов можно сделать краткую запись по любой книге и пустить её в оборот.
Если говорить о продуктах, ориентированных на внешнюю аудиторию, то ещё в 2019 г. мы с помощью «Яндекс Speech Kit» озвучили 2,5 тыс. книг. Не могу сказать, что это было успешно и востребованно, более того, возможно, эти издания надо переозвучить, потому что сервисы стали качественнее. Важно отметить, что технологии ИИ сами по себе — это лишь часть работы, которую надо упаковать в продукт. У нас существует гипотеза: какую-то работу можно выполнить с помощью машинного обучения, затем мы её проверяем, а потом начинается длинная история, которая либо заканчивается продуктом, либо не заканчивается. Один из таких проектов — когда мы при помощи компьютерного зрения и машинного обучения в оцифрованных книгах выделили оглавления, нумерацию страниц, и сейчас работает сервис, ориентированный на книги, доступные лишь в помещении библиотеки.
Если читателю нужен фрагмент, он может поискать его по оглавлению, заплатить и получить на почту одновременно со списанием денег с карты необходимый контент. Второй проект сделан в партнёрстве с компанией «Яндекс». В частности, в поиске по архивам «Яндекса» появились газеты: «Советский спорт», «Вечерняя Москва», «Красная звезда» из архива РГБ. Это симбиоз технологического партнёра и поставщика контента.
Есть один хрестоматийный неудачный проект. Многие библиотекари заполняют паспорта сохранности книг, где надо описать повреждения, имеющиеся на книгах. Казалось бы, инструментами компьютерного зрения можно определить все такие повреждения, и за пару недель мы создали работающий прототип. А потом началась стадия дообучения. Есть глобальная модель компьютерного зрения, которая может определять нечто, а затем надо загружать реальные наборы данных, подключать экспертов, которые могут указать, что это надрыв, а это — разрыв, и т.д. Два месяца мы собирали обучающий и контрольный наборы данных, а затем пригласили экспертов и обнаружили, что на двух специалистов приходится три мнения. К сожалению, люди тоже не отличают надрыв второго порядка от надрыва четвёртого порядка. И поэтому запуск не состоялся. Для того чтобы он стал успешным, надо составить нормальный классификатор и договориться о терминах.
Александр КАРАУШ, генеральный директор Государственной публичной научно-технической библиотеки России:
— Генеративный ИИ даёт скорее предварительный результат работы, который надо «дотачивать». Это касается прежде всего составления проектов документов и отчётов разного уровня. Конвертация данных из одного формата в другой, построение библиографических ссылок тоже функционал ИИ. Конечно, приходится корректировать сведения: множество бакалавров и магистров в этом году использовали ChatGPT для подгонки библиографических ссылок. Перевод рефератов и аннотаций — здесь вопросов нет. Создание изображений и графических образов, не обременённых авторским правом, тоже важная опция. Ещё один аспект — распознавание структуры документа, хотя это не очень корректно работает, требует настройки. Автоматизация взаимодействия с аудиторией в современных системах создания чат-ботов — дело нескольких часов, которые требуются на то, чтобы обучить программу и интегрировать в Telegram. В последней версии ChatGPT это достаточно просто и эффективно.
В библиотечных системах, в частности в «Ирбисе», уже были попытки связать ИИ с API. Результаты пока не очень корректные, и мы ждём: как только в базах знаний ChatGPT появятся более-менее правдоподобные ответы, можно будет их интегрировать с библиотечными системами.
Светлана МОРОЗОВА, заместитель директора Фундаментальной библиотеки Российского государственного педагогического университета имени А.И. Герцена:
— Я вижу миссию университетской библиотеки в обучении, поддержке и сопровождении пользователей. Много лет назад казалось: если предоставить доступ к электронным ресурсам, то все ими будут пользоваться. На самом деле это требует большой работы. То же самое с генеративными моделями, да и с любым ПО со свойствами ИИ. Необходимо рассказывать студентам про нейропоиск, о том, что делают крупные библиотеки и электронно-библиотечные системы. Основную проблему использования ИИ я вижу в том, что непонятно, как с им взаимодействовать. Мы задали первый вопрос, как в Google, модель выдала обтекаемый ответ без учёта контекста, мы посмеялись, но взаимодействие ещё не началось. Это длинный диалог, и обучить ему преподавателей студентов — задача библиотеки.
Геннадий ЕРЕМЕНКО, генеральный директор Научной электронной библиотеки eLIBRARY.RU:
— В eLIBRARY.RU содержится свыше 58 млн документов, ожидается большой рост, поскольку мы сейчас обрабатываем весь мировой поток, а это 7 млн файлов в год. Основной задачей сегодня является организация удобного и эффективного поиска. Есть возможность применять нейросети в целях поиска похожих документов. Совместно с Институтом ИИ МГУ имени М.В. Ломоносова мы запустили проект нейросети по поиску научных документов. Задачей было сделать сервис быстрым и мультиязычным, чтобы он находил похожие документы вне зависимости от того, на каком языке те созданы. В целом эта задача решена, но ещё есть над чем работать. Проект рассчитан на три года. В начале 2024 г. мы внедрили эту нейросеть на eLIBRARY.RU, проиндексировали все документы. Фактически мы заменяем описание документа на многомерный вектор, что позволяет сравнивать файлы между собой по близости векторов. Это даёт много возможностей. Например, поиск рецензентов. Уже сейчас на eLIBRARY.RU можно ввести в поле поиска произвольный текст, получить набор документов, близких по тематике к этой рукописи, проанализировать их состав, определить ключевых авторов и выбрать эксперта. Подобных задач довольно много, например поиск и идентификация авторов. Когда выходит новая публикация и в числе авторов есть фамилия человека, на основе прошлых материалов можно с высокой точностью спрогнозировать, является ли этот учёный их автором. Эта модель позволяет быстро осуществлять такие операции, коллеги из МГУ её совершенствуют и дообучают, поэтому она приближается к топу международного рейтинга. Модель открытая, её могут использовать все желающие, и, если есть коллекции документов с аннотациями, её можно внедрить в любой информационной системе.
Илья БЫКОВНИКОВ, начальник Управления информационно-библиотечного обеспечения Департамента исследований и прогнозирования Центрального банка РФ:
— Мы попробовали все виды моделей, но на базе «Ирбиса» ничего не получилось: результатом стала масса полей, заполненных несуществующими объектами, поэтому пока решили это в каталогизации не использовать. Исключение только одно — подбор ключевых слов. Однако существенно оптимизировать процесс не удалось, потому что приходилось проверять, насколько корректно подобраны слова с учётом специфики нашего фонда. Пробовали использовать генеративные модели, для того чтобы создавать контент. Но афиши нам не нужны, поэтому стали применять ИИ для создания обложек книг, которые прошли реставрацию, если какой-то элемент был утерян.
Ещё один момент. Поскольку библиотека обслуживает Департамент исследований и прогнозирования Центрального банка РФ, мы стали создавать ролики, направленные на популяризацию результатов исследований, пересказывая простыми словами то, что получили исследователи в своих работах.
Что касается пользователей, то далеко не всем сотрудникам на рабочих местах доступен Интернет, поэтому модели ИИ, ориентированные на внешнюю сеть, просто недоступны. Применяется небольшое число моделей, в основном скорее для творческой обработки, нежели для специфической библиотечной деятельности.
Мы, как и коллеги, пытались создавать разметку, чтобы искать экспертов по той или иной теме. Учили модель на 2,5 млн описанных документов. По одной из тем система выдала 24 эксперта, из которых 18 — это один и тот же человек, в зависимости от полной росписи инициалов или сокращённой. В этой части проблемы тоже могут иметь место.
Успешно используем ИИ в переводческой работе, когда речь идёт о редких языках, например о фарси, хинди, когда получаем перевод, выполненный сторонним переводчиком, и не понимаем, качественно ли он сделан.
Как отметил Ю. Чехович, ИИ, по сути, двуличен. Многие говорят о задачах, решаемых с помощью разнообразных алгоритмов, а совсем недавно стали популярными генеративные модели, используемые для обмана.
— Кто скажет, сколько подправленных ИИ изображений сейчас содержится в научных статьях? Мы пытаемся создать детектор искусственного изображения. Антиплагиат порядка 10 лет использует в своей работе самые разные математические модели начиная с кроссязыковых заимствований, поиска плагиата в изображениях. Здесь скорее практика удачна.
Для С. Морозовой самой большой неудачей прошлого года стало разочарование в развитии российских моделей ИИ:
— Как популяризатор я надеялась, что за этот год отечественные системы «Яндекс GPT» и GigaChat выйдут на уровень, когда на их основе мы сможем легально и открыто обучать пользователей. К сожалению, этого не произошло. Более того, российские системы, достигнув определённого уровня, ушли в бизнес-приложения, а в открытом формате оставили решения на начальном уровне. Это всё равно что в середине 2024 г. демонстрировать ChatGPT на версии 3.5.
Д. Нуждова дополнила:
— Действительно, российские разработки пока не соответствуют мировым тенденциям в плане генерации текстов, видео или изображений. Это связано с тем, что в базе у них обучение на англоязычных текстах. Сейчас разработчики стараются это исправлять, но на заре своего развития «Шедеврум» и «Кандинский» по запросу «гвозди» рисовали ногти и наоборот, потому что на английском эти слова пишутся одинаково: nails. И вместо советских пионеров они изображали американских первооткрывателей. Но сейчас нейросети для генерации изображений стали лучше понимать русский язык, русский культурный код. И «Сбер», и «Яндекс» делают для этого очень много.
Ю. Чехович пояснил:
— Хороших сервисов генерации, учитывающих знания и контекст, нет ни у одной модели: ни у российской, ни у иностранной. За рубежом достигают доли ошибок в 2%, но это никого не устраивает. И не надо забывать: пользуясь поиском, мы эту технологию применяем десятки лет и уже обучили свои нейросети разделять результаты на корректные и некорректные. Такой вклад не менее важен, чем работа поисковых алгоритмов «Яндекса» и Google. Поисковики предлагают миллионы ссылок, и это не автоматизированная процедура: далеко не первая ссылка будет правильной.
Как отметил Г. Еременко, есть две идеи, которые не удалось реализовать с использованием нейросетей:
— Первая — оценка научного качества публикации. Если вернуться к подбору рецензентов, то в принципе можно найти людей, работающих в определённой области. Но необходимо, чтобы эксперт по своему научному уровню соответствовал публикации, которую он будет рецензировать. То же самое с подбором журналов для публикации. Вполне возможно, вы найдёте журнал, но вашу статью туда не возьмут из-за её научного уровня. Успешных примеров оценки научной новизны, научного качества с помощью ИИ мы пока не знаем. Косвенные попытки сводятся к оценке наукообразия текста.
Второй момент: мы вначале мечтали о том, что нейросети расширят возможности работы с метаданными. В идеале вы загружаете pdf статьи и на выходе модель выдаёт размеченный контент: ссылки, авторы, аффилиация и т.д. Такие инструменты есть, мы их тестировали, но убедились в том, то никакого выигрыша нет: ошибок много и после всё надо проверять экспертам, это занимает много времени. А когда мы сталкиваемся с русскоязычными публикациями, где метаданные есть на русском и английском языках, модели вообще галлюцинируют. Для принятия точных решений по идентификации автора или ссылки мы пока нейросеть не применяем, потому что это вероятностное решение.
А. Карауш подчеркнул, что пока работа идёт на уровне мнений: хорошо или плохо. Но как только начнётся реальное внедрение технологий, потребуется хотя бы минимальная нормативная база.
— Мне как руководителю крупной госорганизации будет непросто встроить любой вероятностный инструмент в работу. Доказать проверяющим структурам, что я правомерно принял то или иное решение, не получится. И здесь кроется самая большая сложность внедрения подобных инструментов с точки зрения промышленной эксплуатации.
Чего не хватает для более эффективного и активного применения ИИ?
С. Морозова:
— Тестировать генеративные модели и внедрять их в деятельность, возможно, не всем необходимо. Но что могло бы привлечь внимание к этой теме, перевести её из области абстрактных рассуждений в сферу применения? Это наши профессиональные инструменты и положительные примеры использования. Мы ждём выхода на рынок автоматизированных информационно-библиотечных систем с элементами ИИ.
И. Быковников:
— Мы готовы расширить использование ИИ в своей информационной системе, но, поскольку она является государственной, такое изменение должно быть зарегистрировано.
Ю. Чехович:
— На мой взгляд, практически в любых технологических разработках и амбициозных проектах не хватает совмещения аспектов целеполагания с мотивацией и ресурсами. Сегодня у библиотек есть мотивация, но ресурсов недостаточно. То же самое касается российских сервисов в целом. Как только будет достигнут баланс, результат не заставит себя ждать. Пример Open AI показывает, как это может произойти.
Д. Нуждова:
— Конечно, мотивация у нас есть, мы постоянно пробуем что-то новое, но, чтобы заниматься разработкой собственных генеративных моделей, надо обладать временным и человеческим ресурсами. В некоторых библиотеках они есть. Например, проект «ЭлектроНекрасовка» — это собственная нейросеть столичной библиотеки, свои данные, полученные в ходе оцифровки старых книг и журналов, и всё это в бесплатном доступе с красивым интерфейсом. Конечно, нам тоже хотелось бы создать свою нейросеть. Но пока это только планы. ИИ с открытым исходным кодом мы можем обучать под свои задачи и занимаемся этим. Но для создания своих продуктов и их масштабирования не хватает времени и кадров.
П. Лушников:
— Основная проблема — это глобальная инфраструктура, которая позволяет получать ресурсы. Мы придумываем, получаем финансирование, разрабатываем, а за это время
появляется что-то такое, что лучше работает «из коробки».
Итоги дискуссии подвела модератор, главный редактор журнала «Университетская КНИГА» Елена БЕЙЛИНА:
— Конечно, необходим системный подход в обучении и ИИ, и пользователей. Безусловно, надо выстраивать сотрудничество с ИТ-вендорами. Это касается и пакетного использования продуктов, и их доработки, и конкретных проектов для определённых организаций. И разумеется, важен правовой аспект. К сожалению, в части российской практики движения в этой сфере нет, но мы понимаем, какие существуют проблемы: авторское право, вопросы цитирования, создание единых стандартов. Это серьёзная задача на завтра.
Видеозапись выступлений доступна по ссылке: https://www.youtube.com/watch?v=3NroLjy_Z54.
Рубрика: Искусственный интеллект и нейросети
Год: 2024
Месяц: Сентябрь
Теги: Геннадий Еременко Искусственный интеллект (ИИ) Илья Быковников Елена Бейлина Светлана Морозова Юрий Чехович Павел Лушников Фабио Ди Белло КорФор Дарья Нуждова